AI 將可快速分離人聲、各式樂器等音源,Facebook 開源 Demucs 計畫
作者 雷鋒網 | 發布日期 2020 年 03 月 11 日 10:59 |
音樂源分離,是利用技術將一首歌曲分解成它的組成成分,如人聲、低音和鼓,這和人類大腦的工作很類似,大腦可以將一個單獨的對話,從周圍的噪音和一屋子的人聊天中分離出來。
如果你擁有原始的錄音室多軌錄音,這很容易實現,你只需調整混音來分離一個音軌,但是,如果你從一個普通 MP3 檔案開始,所有的樂器和聲音都被混合到一個立體聲錄音中,即使是最複雜的軟體程式也很難精確地挑出一個部分。
Facebook AI 的研究人員已經開發了一個系統,可以做到這一點──精確度高得驚人。
創建者名叫亞歷山大‧笛福茲(Alexandre Defossez),是 Facebook 人工智慧巴黎實驗室的科學家。笛福茲的系統被稱為 Demucs,這個名字來源於「音樂資源深度提取器」,其工作原理是檢測聲波中的複雜模式,對每種樂器或聲音的波形模式建立一個高層次的理解,然後利用人工智慧將它們巧妙地分離。
笛福茲說,像 Demucs 這樣的技術,不僅能幫助音樂家學習複雜的吉他即興重複段落,總有一天,它還能讓人工智慧助理在嘈雜的房間裡更容易聽到語音指令。笛福茲說,他的目標是讓人工智慧系統擅長辨識音頻源的組成部分,就像它們現在可以在一張照片中準確地區分不同的物體一樣。「我們在音頻方面還沒有達到同樣的水平。」他說。
分解聲波的更好方法
聲源分離長期以來一直吸引著科學家。1953 年,英國認知科學家科林‧切爾瑞(Colin Cherry)創造了「雞尾酒會效應」這個詞語,用來描述人類在擁擠嘈雜的房間裡專注於一次談話的能力。
工程師們首先試圖透過調整立體聲錄音中的左右聲道,或調整均衡器設置來提高或降低某些頻率,進而隔離歌曲的人聲或吉他聲。
基於聲譜圖的人工智慧系統,在分離出以單一頻率響起或共振的樂器的音符方面相對有效,例如鋼琴或小提琴旋律。
這些旋律在聲譜圖上顯示為清晰、連續的水平線,但是隔離那些產生殘餘噪音的撞擊聲,比如鼓、低音拍擊,是一項非常艱鉅的任務。鼓點感覺像一個單一的、即時的整體事件,但它實際上包含了不同的部分。對於鼓來說,它包括覆蓋較高頻率範圍的初始撞擊,隨後是在較低頻率範圍內的無音高衰減。笛福茲說,一般的小鼓「就頻率而言,到處都是」。
聲譜圖只能將聲波表現為時間和頻率的組合,無法捕捉到這樣的細微差別。因此,他們將鼓點或拍子低音處理成幾條不連續的垂直線,而不是一個整齊、無縫的聲音。這就是為什麼透過聲譜圖分離出來的鼓和低音軌道,聽起來常常是模糊不清的。
夠聰明的系統來重建缺失
基於人工智慧的波形模型避免了這些問題,因為它們不試圖將一首歌放到時間和頻率的僵化結構中。笛福茲解釋,波形模型的工作方式與電腦視覺相似,電腦視覺是人工智慧的研究領域,旨在讓電腦學會從數位圖像中辨識模式,進而獲得對視覺世界的高級理解。
電腦視覺使用神經網路來檢測基本模式──類似於在圖像中發現角落和邊緣──然後推斷更高級或更複雜的模式。「波形模型的工作方式非常相似」,笛福茲說。他解釋了波形模型如何需要幾秒鐘來適應歌曲中的突出頻率──人聲、低音、鼓或吉他──並為每一個元素生成單獨的波形。然後,它開始推斷更高比例的結構,以增加細微差別,並精細雕刻每個波形。
笛福茲說,他的系統也可以比做探測和記錄地震的地震儀。地震時,地動儀的底座會移動,但懸掛在上面的重物不會移動,這使得附著在重物上的筆可以畫出記錄地面運動的波形。人工智慧模型可以探測到同時發生的幾個不同地震,然後推斷出每個地震的震級和強度的細節。同樣,笛福茲的系統分析並分離出一首歌曲的本來面目,而不是根據預先設定的聲譜圖結構來分割它。
笛福茲解釋,構建這個系統需要克服一系列複雜的技術挑戰。他首先使用了 Wave-U-Net 的底層架構,這是一個為音樂源分離開發的早期人工智慧波形模型。然後他還有很多工作要做,因為聲譜圖模型的表現優於 Wave-U-Net。他透過添加線性單元來微調波形網路中分析模式的演算法參數。笛福茲還增加了長短期記憶,這種結構允許網路處理整個數據序列,如一段音樂或一段視頻,而不僅是一個數據點,如圖像。笛福茲還提高了 Wave-U-Net 的速度和記憶體使用率。
這些修改幫助 Demucs 在一些重要方面勝過 Wave-U-Net,比如它如何處理一種聲音壓倒另一種聲音的問題。「你可以想像一架飛機起飛,引擎噪音會淹沒一個人的聲音」,笛福茲說。
以前的波形模型,透過簡單地移除原始音頻源文件的一部分來處理這個問題,但是它們不能重建丟失材料的重要部分。笛福茲增強了 Demucs 解碼器的能力,「Demucs 可以重新創建它認為存在但卻迷失在混音中的音頻」,這意味著他的模型可以重新合成可能被響亮的鐃鈸聲影響而遺失的柔和鋼琴音符,因為它理解應該呈現什麼樣的聲音。
這種重構和分離的能力使 Demucs 比其他波形模型有優勢。笛福茲說,Demucs 已經與最好的波形技術相匹配,並且「遠遠超出」最先進的聲譜技術。
在盲聽測試中,38 名參與者從 50 首測試曲目中隨機抽取 8 秒鐘進行聽音,這 50 首曲目由 3 個模型分開:Demucs、領先波形、頻譜圖技術。聽眾認為 Demucs 在品質和無偽影(如背景噪音或失真)方面表現最佳。
Demucs 已經引起了人工智慧愛好者的興趣,精通技術的讀者可以從 GitHub 下載 Demucs 的代碼,代碼用 MusDB 數據集來分離音樂源。
笛福茲解釋,隨著 Demucs 的發展,它將為人們在家中創作音樂的數位音頻工作站帶來聲音的真實性。這些工作站提供了能夠喚起特定時代或風格的合成儀器,通常需要對原始硬體進行大量的數位化改造。
想像一下,如果音樂源分離技術能夠完美地捕捉 20 世紀 50 年代搖滾歌曲中用電子管放大器演奏的老式空心電吉他的聲音,Demucs 讓音樂愛好者和音樂家離這個能力更近了一步。
資料來源:https://technews.tw/2020/03/11/using-ai-for-music-source-separation/?fbclid=IwAR1C-0LhFNEkIFUg9QS3xRQK8VKeqKIkPEx9kh7QdGamcsCfUViwyeXyqXg
倒頻譜 原理 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
AI 將可快速分離人聲、各式樂器等音源,Facebook 開源 Demucs 計畫
作者 雷鋒網 | 發布日期 2020 年 03 月 11 日 10:59 |
音樂源分離,是利用技術將一首歌曲分解成它的組成成分,如人聲、低音和鼓,這和人類大腦的工作很類似,大腦可以將一個單獨的對話,從周圍的噪音和一屋子的人聊天中分離出來。
如果你擁有原始的錄音室多軌錄音,這很容易實現,你只需調整混音來分離一個音軌,但是,如果你從一個普通 MP3 檔案開始,所有的樂器和聲音都被混合到一個立體聲錄音中,即使是最複雜的軟體程式也很難精確地挑出一個部分。
Facebook AI 的研究人員已經開發了一個系統,可以做到這一點──精確度高得驚人。
創建者名叫亞歷山大‧笛福茲(Alexandre Defossez),是 Facebook 人工智慧巴黎實驗室的科學家。笛福茲的系統被稱為 Demucs,這個名字來源於「音樂資源深度提取器」,其工作原理是檢測聲波中的複雜模式,對每種樂器或聲音的波形模式建立一個高層次的理解,然後利用人工智慧將它們巧妙地分離。
笛福茲說,像 Demucs 這樣的技術,不僅能幫助音樂家學習複雜的吉他即興重複段落,總有一天,它還能讓人工智慧助理在嘈雜的房間裡更容易聽到語音指令。笛福茲說,他的目標是讓人工智慧系統擅長辨識音頻源的組成部分,就像它們現在可以在一張照片中準確地區分不同的物體一樣。「我們在音頻方面還沒有達到同樣的水平。」他說。
分解聲波的更好方法
聲源分離長期以來一直吸引著科學家。1953 年,英國認知科學家科林‧切爾瑞(Colin Cherry)創造了「雞尾酒會效應」這個詞語,用來描述人類在擁擠嘈雜的房間裡專注於一次談話的能力。
工程師們首先試圖透過調整立體聲錄音中的左右聲道,或調整均衡器設置來提高或降低某些頻率,進而隔離歌曲的人聲或吉他聲。
基於聲譜圖的人工智慧系統,在分離出以單一頻率響起或共振的樂器的音符方面相對有效,例如鋼琴或小提琴旋律。
這些旋律在聲譜圖上顯示為清晰、連續的水平線,但是隔離那些產生殘餘噪音的撞擊聲,比如鼓、低音拍擊,是一項非常艱鉅的任務。鼓點感覺像一個單一的、即時的整體事件,但它實際上包含了不同的部分。對於鼓來說,它包括覆蓋較高頻率範圍的初始撞擊,隨後是在較低頻率範圍內的無音高衰減。笛福茲說,一般的小鼓「就頻率而言,到處都是」。
聲譜圖只能將聲波表現為時間和頻率的組合,無法捕捉到這樣的細微差別。因此,他們將鼓點或拍子低音處理成幾條不連續的垂直線,而不是一個整齊、無縫的聲音。這就是為什麼透過聲譜圖分離出來的鼓和低音軌道,聽起來常常是模糊不清的。
夠聰明的系統來重建缺失
基於人工智慧的波形模型避免了這些問題,因為它們不試圖將一首歌放到時間和頻率的僵化結構中。笛福茲解釋,波形模型的工作方式與電腦視覺相似,電腦視覺是人工智慧的研究領域,旨在讓電腦學會從數位圖像中辨識模式,進而獲得對視覺世界的高級理解。
電腦視覺使用神經網路來檢測基本模式──類似於在圖像中發現角落和邊緣──然後推斷更高級或更複雜的模式。「波形模型的工作方式非常相似」,笛福茲說。他解釋了波形模型如何需要幾秒鐘來適應歌曲中的突出頻率──人聲、低音、鼓或吉他──並為每一個元素生成單獨的波形。然後,它開始推斷更高比例的結構,以增加細微差別,並精細雕刻每個波形。
笛福茲說,他的系統也可以比做探測和記錄地震的地震儀。地震時,地動儀的底座會移動,但懸掛在上面的重物不會移動,這使得附著在重物上的筆可以畫出記錄地面運動的波形。人工智慧模型可以探測到同時發生的幾個不同地震,然後推斷出每個地震的震級和強度的細節。同樣,笛福茲的系統分析並分離出一首歌曲的本來面目,而不是根據預先設定的聲譜圖結構來分割它。
笛福茲解釋,構建這個系統需要克服一系列複雜的技術挑戰。他首先使用了 Wave-U-Net 的底層架構,這是一個為音樂源分離開發的早期人工智慧波形模型。然後他還有很多工作要做,因為聲譜圖模型的表現優於 Wave-U-Net。他透過添加線性單元來微調波形網路中分析模式的演算法參數。笛福茲還增加了長短期記憶,這種結構允許網路處理整個數據序列,如一段音樂或一段視頻,而不僅是一個數據點,如圖像。笛福茲還提高了 Wave-U-Net 的速度和記憶體使用率。
這些修改幫助 Demucs 在一些重要方面勝過 Wave-U-Net,比如它如何處理一種聲音壓倒另一種聲音的問題。「你可以想像一架飛機起飛,引擎噪音會淹沒一個人的聲音」,笛福茲說。
以前的波形模型,透過簡單地移除原始音頻源文件的一部分來處理這個問題,但是它們不能重建丟失材料的重要部分。笛福茲增強了 Demucs 解碼器的能力,「Demucs 可以重新創建它認為存在但卻迷失在混音中的音頻」,這意味著他的模型可以重新合成可能被響亮的鐃鈸聲影響而遺失的柔和鋼琴音符,因為它理解應該呈現什麼樣的聲音。
這種重構和分離的能力使 Demucs 比其他波形模型有優勢。笛福茲說,Demucs 已經與最好的波形技術相匹配,並且「遠遠超出」最先進的聲譜技術。
在盲聽測試中,38 名參與者從 50 首測試曲目中隨機抽取 8 秒鐘進行聽音,這 50 首曲目由 3 個模型分開:Demucs、領先波形、頻譜圖技術。聽眾認為 Demucs 在品質和無偽影(如背景噪音或失真)方面表現最佳。
Demucs 已經引起了人工智慧愛好者的興趣,精通技術的讀者可以從 GitHub 下載 Demucs 的代碼,代碼用 MusDB 數據集來分離音樂源。
笛福茲解釋,隨著 Demucs 的發展,它將為人們在家中創作音樂的數位音頻工作站帶來聲音的真實性。這些工作站提供了能夠喚起特定時代或風格的合成儀器,通常需要對原始硬體進行大量的數位化改造。
想像一下,如果音樂源分離技術能夠完美地捕捉 20 世紀 50 年代搖滾歌曲中用電子管放大器演奏的老式空心電吉他的聲音,Demucs 讓音樂愛好者和音樂家離這個能力更近了一步。
資料來源:https://technews.tw/…/using-ai-for-music-source-separation/…
倒頻譜 原理 在 元毓 Facebook 的精選貼文
【從經濟分析預測台灣蘋果日報三年結束】
本文將從經濟分析中的成本觀念切入,討論為何我認為台灣蘋果日報三年內將被淘汰出局。
這邊要強調的是,傳統經濟學(如Paul Samuelson大名鼎鼎的「Economics」教科書)所教授的「成本」大多錯誤處處且自相矛盾。本文使用的成本觀念謹守「正確的機會成本概念」切入。
1. 同一生產程序有不同產品,收入如何最大化?
Alfred Marshall在1890年經典著作「Principles of Economics」第五卷第六章中提出「joint supply」問題,列舉諸如:羊毛與羊肉、牛皮與牛肉和棉花與棉花籽油都是同一生產程序下會產生的兩種商品,二者間存在固定比率。當牧羊人因用羊毛需求增加而增養綿羊時,羊肉供給也會隨之增加從而影響市價。
現今世界更常見的是汽油與柴油(還有其他油品)之間也存在這種關係。
這使得後來的經濟學家進一步問:如果一個生產程序下會產生多種商品,且不存在固定比率時,收入如何最大化?
答案是:各種商品的平均成本不可求得;但邊際成本可以。收入最大化之道是各種商品邊際價格等於邊際成本;如果引入交易費用概念,則邊際價格與邊際成本的差距不得大過交易費用。
為方便理解,我先以傳統紙媒報紙為例,常見其一個生產程序的產品就包含:不同主題內容的新聞或評論(無體財產)與以印刷與紙張為載體的報章(有體財產),以及廣告。而百年來報紙的收費安排主要有二種極端:一者是以昂貴價格出售,廣告少而內容與印刷均優(如某些極為專業的媒體--如英國金融時報台灣紙本訂購價每日約新台幣$79;經濟學人美國版紙本訂購價單本$3.6美元/台灣零售價$275新台幣);另一者則是give-away papers,如台灣曾流行的捷運免費報,這類報紙完全免費但內容幾乎都是廣告,印刷品質與紙質均低劣。
多數報紙收費安排在二種極端之間。
此外,就我所知的成本結構,台灣若報紙零售價在$10以下者,大概都是只回收了印刷、紙張與運送的費用,「向讀者直接收費」這塊是毫無利潤可言。
經濟學上也透露著:不同的收費安排會影響報紙媒體在終端產品上的呈現,包含內容的長度、深度、廣度、可信賴度與品質,包含廣告數量、呈現方式(如佔版面比率)與廣告品質(純文字廣告亦或聘請世界明星代言且由知名設計師編排之廣告)。
上述經濟原理,放到網路新聞媒體上也是一樣。
2. 邊際生產成本並非為零
我們可以從兩個角度去看線上報紙的生產成本:
a. 從線上訂閱讀者看
傳統經濟學教科書很愛說:「網路世界提供服務的邊際成本趨近於零」。其實這是錯誤的說法。持此說法的學者不但對真實世界認識不清,同時經濟學也不及格。
(1) 如果邊際成本近乎於零,則平均成本曲線不再是U形而也會是趨近於零,則根據經濟學法則,世界上各種網路服務供應商將只有一家完全壟斷,這與真實世界不符。
(2)Google在伺服器與頻寬支出一個會計季度就高達幾十億美元,怎麼看也不像是「邊際成本趨近於零」會產生的費用。
雖然我不是專家,但以我過去架設Linux server以及使用cloud computing services的經驗,上述經濟學者最大的錯誤在於「計量錯誤」。
以Apache網頁伺服器看,一個連線大約會佔伺服器12~35MB記憶體,一張圖片豐富的頁面(假設4MB)大約要吃掉32Mbps頻寬,同時還要考慮CPU響應速度與使用者的單位時間點擊頻率等等。簡單說,即便以一次點擊服務的角度看,邊際成本恐怕都不是趨近於零。當架設的網站流量成長到機器可承受邊緣時,不管我是要升級機器、增加伺服器、增加頻寬,其邊際成本更不是以「每多一位使用者」為邊際單位,而是以上述機器與頻寬的綜合考量為邊際單位。
這是說為了應付一天某幾個時段的高峰使用,我必須備好足夠的運算力與頻寬;但當其他時段在線人數掉下來時,我的運算力與頻寬是閒置但費用依然要支付的。此外,隨著使用者的人數增長過某些門檻,許多小型服務不需要支付的費用或問題也會隨之而生。
這一塊我從香港壹傳媒公開的財務報告中並無法清楚查出,但從其2019年(會計年度結束於2019/3/31)年報記載的「其他營運費用」高達3億港幣(約新台幣11.6億元)可窺知其網路服務相關費用支出應該不低。
我們換個更容易理解的角度:網路服務就像一個個水桶,其內含容量空間是邊際單位總成本。每一位使用者都是顆小乒乓球,球體體積是訂閱費。當一個水桶裝不滿乒乓球時,這個邊際服務單位收入是低於邊際成本的。當使用者量剛好裝滿1個水桶時,邊際成本與邊際收入相符,是前述經濟學原理下收入最大化狀況。但若裝滿1.1個水桶時,則看似更多的使用者其實可能卻是在一個網路服務虧損放大的區段。而且,水桶中的乒乓球數量是每一秒都在變化的。
當然上述形體化的描述只是為了方便理解,真實網路服務提供的成本狀況不完全是這樣。但我希望能幫助讀者理解我想要點出的重點:計量基準並非以「每多一人」為準。以訂閱收入扣除成本為縱軸,以訂閱人數為橫軸,其曲線是非常波動的,一定區間內,訂閱人數增加收入可能反而減少。因此,以台灣每日約4元新台幣或香港每日約$1.68港幣的訂閱價格看,並不見得「高於邊際成本」。
b. 從線上廣告看
吸引讀者靠的是內容,而內容的產生與發佈在線上同樣存在持續的成本投入才做得到。
此外,以我過去與壹傳媒購買廣告的經驗可知,多數廣告套裝(特別線上版)多是以5天為最少單位(當然有例外狀況,這裡我只講普遍而言的現象),週末另外定價。因此再換一個成本角度,從邊際而言我們可以把5天為一個單位將人員費用與行政費用(包含伺服器與頻寬租賃費)以2019年香港壹傳媒的財報做估算,台灣蘋果日報每5天的新聞生產與發佈總成本大約為800萬港元(約$3100萬新台幣)。
綜合二者,如果我們把每五天的新聞內容生產當做是一個生產計畫(production plan),則每單位$3100萬會是直接成本,若來自訂閱與廣告收入無法超過此數字,則蘋果日報面臨的是直接虧損。其中,蘋果日報可以選擇方案一「免費閱讀佐以大量廣告」或方案二「訂閱付費佐以少量廣告」。前者必然會發生減少文章字數、一文拆多文、追求標題黨與廣告滿佈...等等現象;後者則理應要以深度報導或提供競爭對手難以取代的內容來又使付費訂閱者認為物有所值。
3. 從壹傳媒財報見端倪
承第1點所述,當台灣蘋果日報網路版轉為訂閱制後,可見的是網路流量競爭之下必然會有相當幅度下跌(畢竟免費新聞來源充斥且讀者近乎毋須付出轉換成本),這點我們也可以分別從東森集團總裁王令麟的接受訪談間接與Alex網路排名直接得到印證:
「...他認為蘋果在這方面(訂閱制)犯了錯,光以流量來說蘋果從2,200萬下跌剩不到1,000萬。「但是流量事還小,我們(ETtoday)數位廣告營收在去年6月將近7千萬元跟他們伯仲,但今年蘋果已經跌破4千萬,我們數位廣告已經在8千萬往9千萬元走。」就算蘋果擁有付費訂閱用戶,王令麟也認為「台灣市場太小,很難成功。」根據香港壹傳媒9月中公布的公告指出,香港蘋果日報、壹週刊付費人數已經超過84萬人,台灣訂戶人數則未有揭露。」
Alex有關台灣網路媒體流量變化如下:
(圖一 蘋果日報)
(圖二 自由時報)
(圖三 東森新聞)
(圖四 中國時報)
(圖五 聯合報)
我們可以從壹傳媒整體財報(見圖六)看出,在面對Google與FB這類網路廣告巨獸的強力競爭下,從2016年轉盈為虧後,每年虧損額達三、四億港幣,營收更是節節下滑。
根據壹傳媒公布的香港部分84萬人訂閱戶(台灣人數未揭露我認為應該是因為數字遠低於此),其每年訂閱費收入約HK$515M,而2019年度財報顯示整體營收衰退至約HK$1304M以及流量快速下滑來看,恐怕杯水車薪,訂閱收入無法彌補失去的廣告收入將是必然。網站(包含app)流量的下降必然導致蘋果日報在廣告議價權的下降,這意味根據前述經濟學原理,其虧損放大的速度恐快得出乎主事者想像。這點就要等2020年度財報得印證。
4. 上頭成本的租值攤分
接著,我們再換個角度從上頭成本看台灣蘋果日報:
上頭成本是指企業不管生不生產都要付費的成本,對報社而言,場地租金、各種軟硬體設備、記者主編與管理者費用、伺服器開支(如果為承租)與網路頻寬租賃等...,都屬之。
而這些開支是由產品收入扣掉直接成本以上的盈餘累加後應付的,以蘋果日報的狀況這意味著:
a.台灣蘋果日報建構所需的上頭成本很可能與香港蘋果日報一樣甚至更高,因為台灣土地面積是香港的32.7倍。但我們從香港壹傳媒集團財報中得知,台灣蘋果與壹週刊僅佔總營收整體30%。佐以媒體產業的經濟特色 -- 量體夠大平均成本可以掉得很快,但量體越小則平均成本也可以升得飛快。表示台灣分部可貢獻的上頭租值不但小,甚至貢獻的虧損額度恐怕還大過香港。
b.這解釋為何2010年左右,黎智英在台灣努力地希望促成壹電視的開播 -- 因為同一生產程序可以同時出產紙本、網路與電視新聞。而佐以IT科技越發物美價廉的、各種手機攝影與app應用不但逐漸讓單一記者具備多工能力(撰稿、拍攝甚至簡易後製)下,智慧型手機加入下越大量體的受眾可以快速降低壹傳媒在台的邊際成本,從而提高整體獲利能力。
c.這更解釋黎智英為何願意虧損百億元代價執行壹電視計畫(包含近乎免費贈送的樂視通機上盒),因為從經濟分析角度看其戰略思維正確無誤,卻被台灣既有媒體業者、政府管制給卡死。短短三年,於2013年6月就認賠賣給年代集團後,整個蘋果日報內容定位從相對中立轉向極為反中、台獨路線。我認為蘋果日報的定位之轉變,以及黎智英在香港16年佔中運動與19年反送中運動的作為,都源自於上述商業策略執行層面的失敗以及實際所受的經濟虧損。
可是訂閱制於2019年7月上路後,從Alex數字看來台灣蘋果日報希望搶占的市場顯然是輸給了類似定位自由時報。
這一點我建議讀者參考我寫過的「略談旺中投資蘋果日報案(2012/12/05)」一文的第三點:
「...台灣藍綠媒體市場區隔還蠻明顯的。這不是什麼大問題,美國媒體左派(如NYT)、右派(如Fox News)也是壁壘分明;這也不是媒體邪惡,市場導向、利之所趨罷了。
換言之,從經濟分析角度來看,假設A媒體專攻A'市場,B媒體專攻B'市場;今天若A決定轉向B',則其最主要的成本就是必須放棄A'所帶來的盈利。例如男人幫(FHM)今天假如要切入商業周刊的市場,在不推出新報刊雜誌的前提下,其勢必要放棄的是男人幫既有市場的利潤。
從這角度看,一家走中立八卦路線的壹傳媒,假如因為幕後老闆換人而要改走親中國路線的藍色市場,則必然新壹傳媒得失去部分既有客戶的盈利,而這就是壹傳媒轉型的成本。此轉型與前假設例子並無差別。淺顯的道理,連路邊攤小販都懂。而市場觀察告訴我們,頻譜兩端點的觀眾數量相對較少,中間地帶者居多。若蔡衍明等人買下壹傳媒後,將其轉型為深藍媒體,則勢必要面對收入減少;同時,在競爭之下,蘋果與既有深藍媒體(旺旺中時)打起擂台,經濟學告訴我們假若市場結構無太大變化,結果是二者租值都一起降低,首當其衝的損失者是蔡衍明等人。
再想想私有產權,假若有人投資失利,是出於資訊不足、愚蠢或刻意為之,都與非股東的第三人無關。蔡老闆商場征戰多年,如果連這點道理都不懂而產生損失,那也是他自做自受,學生的抗議遊行都顯得無關痛癢。再假設蔡老闆投資壹傳媒的資金來自於中國政府的挹注,則虧損的也是愚蠢或一廂情願的中國政府。
媒體會變一言堂?當然不會。
台灣有既有的深綠媒體(自由時報)。而蔡先生假若真將壹傳媒變成中時,則空出來的市場反倒是可以吸引其他人進入經營。
黎智英來台灣經營蘋果日報與壹週刊,三年內損益兩平開始獲利,顯見這塊市場不但大,還有黎智英的經典前例,大幅降低後來者的訊息費用。故除非市場有大變動,否則有人跳出來收納這塊市場是可以想見的(當然此人也包括蔡老闆本身)。台灣要變一言堂,得透過政府暴力回到過去戒嚴時期才有可能;現在看來,政府要這樣做的成本很高。...」
虧損壓力下的黎老闆被迫走極端內容產品希冀提高獲利是可以想見;但目前看來,似乎兩頭空的終局可能性比較高。
d.以蘋果日報的流動資產快速下降(見圖七),速動比(acid-test ratio)惡化:2018年2.72;2019年1.03;營運淨現金流出更是從2018年的(HK$31M)惡化到2019年的(HK$137M);若非2019年度因賣出廠房資產獲利HK$259.9M,其實帳面虧損會更難看(約HK$599.9M)。所以主事者急於今年改變收費安排,希望增加可預測穩定收入是無可厚非。但承前面的經濟分析所預測:蘋果日報線上版的兩種收費安排均可能發生邊際收入低於邊際成本的分離現象,整體虧損不但無法改善,甚至會擴大得超乎預期。
結論:
從經濟分析看,蘋果日報的收費制度不但無助於改善連年營收下滑與虧損,反而是註定失敗、註定擴大虧損與現金失血的失敗商業模式。
而該公司的流動資產與流動負債狀況不妙,可獲利的固定資產已經出清。在不改變收費安排以及無新資金挹注的前提下,我推估蘋果日報三年內就會離開台灣市場,不管是結束營業或是被併購。(尤其考量黎老闆以三年為時間區段測試一種商業模式的習慣)
文末順便附上成功的網路報紙訂閱制財報:The New York Times(見圖八)
各位可以清楚看到蘋果日報相對NYT,營收與獲利能力的差異。
後記:
此文的判斷大約兩、三個月前就已經形成,但今天才有空寫成文字。作為蘋果日報台灣版最早的讀者(當年在台灣開報時隨報贈送的蘋果我也吃了幾顆);也曾與蘋果日報/壹週刊有相當時間商務往來(每週支付廣告費達七位數);也曾受該社X總宴請日本料理。寫這篇預測文,多少也有點傷感。
不過還是老話一句:掌握正確關鍵侷限條件,經濟學科學性預測的準確率驚人。立此存證,三年後再來印證吧。
最近轉忙,近半年左右沒太多時間寫文更新,特此告知。
http://yuanyu.idv.tw/2019/11/04/%e5%be%9e%e7%b6%93%e6%bf%9f%e5%88%86%e6%9e%90%e9%a0%90%e6%b8%ac%e5%8f%b0%e7%81%a3%e8%98%8b%e6%9e%9c%e6%97%a5%e5%a0%b1%e4%b8%89%e5%b9%b4%e7%b5%90%e6%9d%9f/
倒頻譜 原理 在 NLP ASR 语音转文本-04-basic 基本原理 的推薦與評價
五、倒谱:离散余弦变换(DCT). 尽管可以用mel频谱本身作为声音特征,但使用倒谱有其优点并且可以提高识别性能。 抛开预加重 ... ... <看更多>